Context Engineering

定义

为模型动态构建整个上下文环境的管理工程，包括相关文件、历史对话、工具定义、知识库检索结果等，让模型在做每一个决策时都能看到它需要看到的信息。由 Andrej Karpathy 和 Shopify CEO Tobi Lütke 在 2025 年提出。

在构建一个 95 分的 Agent 系统中，Context Engineering 可以将效果从 70+ 分提升到 80~85 分。

概念	时间	说明
Prompt Engineering	2022-2024	精心构造单次指令
Context Engineering	2025	为每个决策点动态构建上下文
Harness Engineering	2026年2月	设计完整的控制系统（包含 Context Engineering）

即使把所有无关内容遮掉强迫模型只看需要的信息，性能还是滑坡 13.9% 到 85%。即使替换成空白符结果依然如此。问题不在找不到信息，而是上下文的纯长度本身就在伤害推理。

Harness Engineering 包含 Context Engineering，但在更高层面运作：

给 Claude Code 写的"项目说明书"和"行为规范"，内容会被注入到 System Prompt 中，优先级很高。

四种路径：

按照激进程度递增，在"保留关键信息"与"节省 token 成本"之间找到平衡：

自动压缩触发机制：设定安全缓冲水位线（AUTOCOMPACT_BUFFER_TOKENS = 13,000），当上下文窗口剩余空间低于这个阈值时，自动介入判断。分级回退策略：首选 Session Memory Compact，降级到 Full LLM Compact。

将记忆明确拆解为四种核心类型：

LLM-in-the-loop 的检索策略：使用 Sonnet 模型充当"图书管理员"，对候选记忆进行语义相关性判断，强制约束只返回最多 5 条最相关的记忆。